Previsão de vendas em eCommerce

Autor: André de Albuquerque

Sumário

1. Introdução


drawing

A previsão de vendas é um processo no qual uma empresa pode estimar suas vendas futuras com base em dados anteriores e comparações do setor. Como um processo, a previsão de vendas permite que as empresas utilizem esses dados para produzir planos de desempenho precisos que podem moldar a maneira como fazem negócios.

Algumas das principais áreas em que uma previsão de vendas pode beneficiar sua empresa são a previsão das receitas de vendas por períodos variados de tempo, o que permite que a empresa atribua recursos apropriadamente onde necessário e desenvolva planos baseados em dados para crescimento e expansão futuros.

O objetivo deste deste projeto é prever as vendas para o ano de 2015 com base nos dados fornecidos. Além de demonstrar algumas conclusôes fundamentada nos dados.

fonte: act, s.d.

2 Conteúdo da base de dados

O conjunto de dados pode ser baixado neste link.

3. Análise exploratória dos dados

4. Feature engineering

O modelo erra cerca de 25% dos dados de teste

O gráfico mostra uma distribuição enviesada à direita

O histograma com transformação box-cox mostra uma distriuição próxima ao normal

p-value muito maior que 0.05. Portanto a série não apresenta estacionaridade com transformação por função logarítimica

O p-value do teste com essa diferenciação é praticamente zero. Portanto, a série se tornou estacionária.

Observa-se no gráfico que há sazionalidade na série. com tendência de queda nos meses de Janeiro e Julho

5. Predição de novos dados

O modelo auto-arima encontrou o modelo SARIMA com termos p, d, q igual à (1,1,2), respectivamente. E ordem sazional de (2,1,0).

O critério de informação de Akaike (AIC) é um estimador de erro de predição e, portanto, da qualidade relativa dos modelos estatísticos para um determinado conjunto de dados. Dada uma coleção de modelos para os dados, o AIC estima a qualidade de cada modelo, em relação a cada um dos outros modelos. Portanto, o AIC fornece um meio para a seleção do modelo.

6. Conclusão

O conteúdo da base dados entre o período de 2011 à 2014, mostra que o segmento dos clientes se divide em: consumidor, corporativo e home office. Sendo os clientes do segmento consumidor, os principais, com valores utrapassando os 6 milhões.
Além disso, clientes dos EUA são os que mais compram, chegando em quase 2.5 milhões. Em termos de região, países do APAC (Ásia-Pacífico), formado por Ásia Oriental, Sul da Ásia, Sudeste da Ásia e Oceania, possuem maiores valores de venda, responsável por 26.7% do total de vendas. Sendo os produtos da categoria tecnologia os mais vendidos, ultrapassando 4 milhões do total de venda do período.
Outro fator identificado tem relação a descontos e taxa de entrega. Os dados mostram que a média mensal de custo de entrega aumentam a medida em que o valor de venda sobe. Sendo na região da Ásia, os lugares com maiores custos. Ainda, algumas vendas tiveram mais 80% de desconto. Sendo o produto mesa, o qual teve quase 30% de desconto, refletindo no lucro final do período, trazendo prejuízo a empresa referente a este produto. Em contrapartida, o produto copiadora trouxe os melhores resultados, com mais de 100 mil em valor de venda.
A partir desses dados, foi possível prever as vendas para o ano de 2015. Esperando-se assim, um total de venda de aproximadamente 6.85 Milhões, com taxa de crescimento de 59% em relação a 2014.

Por fim, como sugestão para alcançar os resultados esperados, recomenda-se: